贝叶斯网络是概率图形模型,可以紧凑地代表随机变量之间的依赖性。缺少数据和隐藏变量需要计算变量子集的边际概率分布。虽然了解边际概率分布的知识对于统计和机器学习中的各种问题至关重要,但由于该任务的NP硬度,其确切的计算通常不可能对分类变量不可行。我们使用贝叶斯网络的图形属性开发了分频和征服方法,以将边际概率分布的计算分成较低维度的子计算,降低整体计算复杂性。利用此属性,我们提出了一种估计分类变量的边际概率分布的有效和可扩展的算法。将新方法与基准测试中的最先进的近似推理方法进行比较,在那里显示出优异的性能。作为即时申请,我们展示了边际概率分布如何用于对贝叶斯网络的不完全数据进行分类,并使用这种方法来鉴定肾癌患者样品的癌症亚型。
translated by 谷歌翻译